結合線上翻譯服務的跨語言專利檢索系統 (Integrating Query Translation and Text Classification in a Cross-Language Patent Retrieval System) [In Chinese]
نویسندگان
چکیده
In this paper, we introduced a cross-language patent retrieval system which combined the various free web translators on the internet. The bi-gram indexing method was used to deal with the multilingual patent documents, and the query translation method was used to translate the query form the source language to the target language. Currently, this system provides the functions of the monolingual and cross-language patent retrieval in English and Japanese. The users can input the queries and use the different translation systems to process the query translation. The different fields of the query topics and various patent document sets are selected to perform the cross-language patent retrieval from Japanese to English, and vice versa. 關鍵詞:跨語言檢索、專利檢索、Bi-gram、查詢翻譯
منابع مشابه
線上新聞語音檢索系統 (Online New Retrieval Based on Speech Input) [In Chinese]
陳江村 羅瑞麟 張智星 國立清華大學 資訊工程系 新竹市光復路二段 101 號 E-mail : {jtchen,roro,jang}@wayne.cs.nthu.edu.tw TEL: (03)5715131-3582 摘要: 在此報告中,我們實作了一個結合隱藏式馬可夫模型(Hidden Markov Model, HMM) 為基礎的 HTK(HMM Toolkit)和網頁資料檢索技術的線上新聞語音資料檢索系 統。一般的網頁資料檢索(如 google)須使用者輸入相關文字,才得以文字比對 方式進行檢索。在此我們則嘗試加入語音辨識的技術讓使用者更易進行檢索。本 系統分成新聞前處理及語音查詢兩階段。在辨識內容固定,高準確度的辨識結果 下,本系統特別適用於手機、PDA、嵌入式系統等小型、不易以手操作輸入的裝 置。本系統亦經清大盲友會的盲人朋友試用,反應十分良好。 關鍵詞:語音辨識、資料檢...
متن کامل具相關資訊回饋能力之貝氏混合式機率檢索模型 (Using Relevance Feedback in Bayesian Probabilistic Mixture Retrieval Model) [In Chinese]
摘要 本篇論文提出新穎之相關回饋(Relevance Feedback)方法並應用於混合式機率檢索系統(Mixture Probability Model)以提昇檢索效能。相關資訊回饋法以往最常用的技術是查詢句擴充法(Query Expansion),本回饋方式 是架構在以混合式機率模型為主的檢索系統上,為了加強檢索效能,我們是在查詢句擴充法中,強調不同查詢 詞的重要性,所以提出查詢詞權重重調整(Query Term Reweighting)技術;此外,我們也利用檢索出來的前 N 名文件和資料庫的每份文件個別重調成新的文件語言模型,以提供較好的文件語言模型提供檢索時使用。在查 詢字權重之重調整部分以最佳相似度(Maximum Likelihood)為估測準則,而文件語言模型之調整部分先後以 最佳相似度與最佳事後機率(Maximum a Posteriori)為估測準則供我們對照比較,...
متن کاملSemantic Associative Topic Models for Information Retrieval
主題模型(topic model)被廣泛地應用在各種文件建 模以及語音識別、資訊檢索和本文探勘系統中,有 效地擷取文件或字詞的語意和統計資料。大多數主 題模式,例如機率潛在語意分析(probabilistic latent semantic analysis) 和 潛 在 狄 利 克 里 分 配 (latent Dirichlet allocation),主要都透過一組潛藏的主題機 率分布來描述文件與字詞之間的關係,並用以擷取 文件的潛在語意資訊。然而,傳統的主題模型受限 於詞袋(bag-of-words)的假設,其潛藏主題僅能用來 擷取個體詞(individual word)之間的語意資訊。雖然 個體詞可傳達主題信息,但有時會缺乏本文準確的 語意知識,容易造成文件的誤判,降低檢索的品 質。為了改善主題模型的缺點,本論文提出一種新 穎的語意關聯主題模型(semantic associ...
متن کامل以語言模型判斷學習者文句流暢度(Analyzing Learners 'Writing Fluency Based on Language Model)[In Chinese]
由於現代科技以及 3C 產品的普及,使得孩子頻繁的接觸電視、網路、手機...等,因此 容易缺乏與人之間互動、溝通以及情感的表達,相對的,學生寫的作文常常是以流水帳 交代經過,有的學校甚至不考作文,但隨著教育政策的變動,國中教育會考加入了作文 評量的項目,使的作文再度受到學生及家長的重視。可是受限於學校教學時數,作文較 弱的學生容易缺少補救的機會。我們認為未來自學作文以及在家練習,可以藉由自動化 的作文教學系統輔助。而本系統開發作文教學系統之句子流暢度偵測,經由系統回饋的 診斷結果可以讓學生對詞句組合的理解力有所提升,幫助學生寫出較流暢的句子,藉此 提高他們的作文分數。系統所依賴的 N-gram 語言模型,它的特性是計算字詞間組合的 機率,機率越高的話字詞組合的正確性越高也就是越流暢,而語言模型效果相當依賴大 型的訓練語料,這是語言模型然能待克服的缺點,例如資料稀疏(Data spar...
متن کاملRealizing Customizeable Animations in a Multi-user Virtual En- vironment using OSGi Framework
多人虛擬環境(Multi-user Virtual Environment) 系統的應用越來越多,而系統的延展性及內容的豐 富性是未來 3D 內容服務能否普及的關鍵之一。 IMNET 是一套具延展性的多人虛擬環境系統,可 在編譯或執行期間,整合不同的動畫元件模組,增 加 系 統 的 彈 性 [8] 。 使 用 者 可 以 透 過 XAML(eXtensible Animation Modeling Language)語 言的設計,產生虛擬角色的動畫;然而,對於高階 指令的實現,目前多僅能由系統提供有限的選擇, 而無法由使用者自行設計。本論文的目的在 IMNET 的平台上,設計一個能由使用者自行擴充動畫標籤 及實現此標籤之動畫元件的機制。當使用者開發一 個新的動作時,可以同時讓所有線上使用者接受動 作的擴充,而不需要重新啟動 IMNET 系統,或是 手動的安裝。本論文是以 OSGi F...
متن کامل